Skyline Ranking à la IR
نویسندگان
چکیده
Skyline queries have emerged as an expressive and informative tool, with minimal user input and thus, they have gained widespread attention. However, previous research works tackle the problem from an efficiency standpoint, i.e., returning the skyline as fast as possible, leaving it to the user to manually inspect the entire skyline result. Clearly, this is impractical, even with a few dozen points. The techniques addressing this issue are computationally expensive, mapping to NP-Hard problems or having exponential complexity O(2) with respect to data dimensionality d. Moreover, the result is a set, lacking any quality-based ranking. In this paper, we propose a novel IR-style ranking mechanism for skyline points, based on the renowned tf-idf weighting scheme. We present efficient algorithms to compute the quality of a skyline point according to our technique, and induce a total ordering of the skyline set. Finally, we empirically evaluate the efficiency of our method with real-life and synthetic data sets.
منابع مشابه
Relaxation des Requêtes Skyline : Une Approche Centrée Utilisateur
Résumé. Les requêtes skyline constituent un outil puissant pour l’analyse de données multidimensionnelles et la décision multicritère. En pratique, le calcul du skyline peut conduire à deux scénarios : soit (i) un nombre important d’objets sont retournés, soit (ii) un nombre réduit d’objets sont retournés, ce qui peut être insuffisant pour la prise de décisions. Dans cet article, nous abordons ...
متن کاملRequêtes skyline en présence d'exceptions
Résumé. Dans cet article, nous nous intéressons à la recherche des points les plus intéressants au sens de l’ordre de Pareto, i.e., à l’évaluation de requêtes « skyline » , dans des jeux de données présentant des anomalies. Il n’est pas rare que les données, de petites annonces par exemple, soient peuplées d’erreurs ou d’exceptions qui peuvent perturber la recherche des meilleurs points car cel...
متن کاملRequêtes Skyline avec prise en compte des préférences utilisateurs pour des données volumineuses
Résumé. Appréhender, parcourir des données ou des connaissances reste une tâche difficile en particulier lorsque les utilisateurs sont confrontés à de gros volumes de données. De nombreux travaux se sont intéressés à extraire des points "skylines" comme outil de restitution. La prise en compte des préférences a retenu l’attention des travaux les plus récents mais les solutions existantes resten...
متن کاملLink-based Ranking of Skyline Result Sets
Skyline query processing has received considerable attention in the recent past. Mainly, the skyline query is used to find a set of non dominated data points in a multi-dimensional dataset. One of the major drawbacks of the skyline operator is the high cardinality of the result set. Providing the most interesting points of the skyline set (top-k) inherently involves the ranking of the skyline p...
متن کاملTreillis des Concepts Skylines : analyse multidimensionnelle des Skylines fondée sur les ensembles en accords
Résumé. Le concept de SKYLINE a été introduit pour mettre en évidence les objets « les meilleurs » selon différents critères. Une généralisation multidimensionnelle du SKYLINE a été proposée à travers le SKYCUBE qui réunit tous les SKYLINES possibles selon toutes les combinaisons de critères et permet d’analyser les liens entre objets SKYLINES. Comme le data cube, le SKYCUBE s’avère extrêmement...
متن کامل